22 Glossário

Agent: Sistema de IA que pode executar ações autonomamente, frequentemente utilizando LLMs como cérebro.

Alignment (Alinhamento): O processo de garantir que os comportamentos de um modelo de IA estejam alinhados com as intenções e valores humanos.

Attention Mechanism (Mecanismo de Atenção): Técnica que permite ao modelo prestar atenção seletivamente a diferentes partes da entrada ao processar cada elemento.

BERT: Modelo baseado em codificador, desenvolvido pelo Google,notable for understanding tasks.

Chain-of-Thought (Cadeia de Pensamento): Técnica de prompting que incentiva o modelo a mostrar seu raciocínio intermediário.

Context Window (Janela de Contexto): Quantidade máxima de texto que o modelo pode processar simultaneamente.

Decoder: Componente do Transformer que gera sequências token por token.

Embedding: Representação vetorial densa de tokens que captura relações semânticas.

Fine-tuning: Ajuste fino de um modelo pré-treinado para um domínio ou tarefa específica.

Flash Attention: Técnica para acelerar o cálculo de atenção reduzindo a memória necessária.

Generative AI (IA Generativa): Sistemas de IA capazes de criar conteúdo novo, incluindo texto, imagens, áudio e código.

Gradient: Vetor de derivadas parciais que indica a direção de maior aumento de uma função de perda.

Hallucination (Alucinação): Quando um modelo gera informação incorreta ou fabricada com aparente confiança.

Inference: Processo de usar um modelo treinado para fazer previsões ou gerar conteúdo.

In-Context Learning: Capacidade de um modelo de aprender de exemplos fornecidos no prompt sem ajustar pesos.

LLM (Large Language Model): Modelo de linguagem de grande escala treinado em vastas quantidades de texto.

LoRA (Low-Rank Adaptation): Técnica de fine-tuning eficiente que adiciona adaptadores de baixo posto.

Multimodal: Capacidade de processar múltiplas modalidades de dados, como texto e imagens.

NLP (Natural Language Processing): Campo da IA focado em processamento e compreensão de linguagem natural.

Parameter (Parâmetro): Valor ajustável em uma rede neural que é aprendido durante o treinamento.

Prompt: Entrada de texto fornecida ao modelo para elicitar uma resposta.

Quantization: Técnica para reduzir a precisão numérica dos pesos do modelo, diminuindo requisitos de memória.

Retrieval-Augmented Generation (RAG): Abordagem que combina LLMs com busca em bases de conhecimento externas.

RLHF (Reinforcement Learning from Human Feedback): Técnica de alinhamento usando feedback humano.

Self-Attention (Auto-Atenção): Mecanismo de atenção onde queries, keys e values vêm da mesma sequência.

Temperature: Parâmetro que controla a aleatoriedade da geração de texto.

Token: Unidade básica de texto processada pelo modelo.

Tokenization: Processo de converter texto em sequência de tokens.

Top-k/Top-p Sampling: Técnicas para limitar a aleatoriedade na seleção de tokens.

Transformer: Arquitetura neural baseada em mecanismos de atenção que revolucionou o NLP.

Vanilla Transformers: Versão original do Transformer com codificador e decodificador.